AI资讯新闻榜单内容搜索-LLaMA

32专家MoE大模型免费商用！性能全面对标Llama3，单token推理消耗仅5.28%

每个token只需要5.28%的算力，精度就能全面对标Llama 3。

来自主题: AI技术研报

11721 点击 2024-05-30 15:51

就在刚刚，法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言，而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前，已经开放API与IDE插件供用户使用。

来自主题: AI技术研报

11498 点击 2024-05-30 15:16

马斯克最近哭穷表示，xAI需要部署10万个H100才能训出Grok 3，影响全球的大模型算力荒怎么解？昨天开源的这款MoE大模型，只用了1/19算力、1/19激活参数，性能就直接全面对标Llama 3-70B！

来自主题: AI技术研报

9587 点击 2024-05-29 15:14

大模型价格战打得火热这几天，大模型的价格战打得火热。模型价格一降再降，百度、科大讯飞、腾讯甚至直接宣布免费。

来自主题: AI资讯

8117 点击 2024-05-24 12:27

Llama 3发布一个月后，一位开发者在GitHub上创建了名为「从头开始实现Llama 3」的项目，引起了开源社区的广泛关注。代码非常详细地展现了Llama所使用的Transformer架构，甚至让Andrej Karpathy亲自下场「背书」。

来自主题: AI技术研报

11309 点击 2024-05-21 15:20

5月14日，开源的大语言模型Falcon 2发布，性能超越Llama 3，消息登上了Hacker News热榜第一。「猎鹰」归来，开源宇宙将会迎来新的霸主吗？

来自主题: AI技术研报

11643 点击 2024-05-20 16:14

Llama 3开源后，聊天机器人Meta AI也宣布使用新模型作为基座，在Meta旗下的各种软件（Meta.ai、Instagram、Facebook、WhatsApp）中都可以进行免费体验。

来自主题: AI技术研报

11396 点击 2024-05-18 17:51

Llama 3首发阵容里没有的120B型号竟意外“曝光”，而且十分能打？！

来自主题: AI资讯

7693 点击 2024-05-13 17:34

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。

来自主题: AI资讯

11146 点击 2024-05-06 20:51

我们知道，Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 实验室推出的 Jamba 等开源大语言模型已经成为 OpenAI 的竞争对手。

来自主题: AI技术研报

11864 点击 2024-05-06 17:49